深度长文| 建造一个“硅脑”,改变整个世界
基于生物神经元的计算机芯片可能有助于模拟更大、更复杂的大脑模型。
上图: 智能芯片
Heidelberg 小组的物理学家 Karlheinz Meier 设计的神经形态芯片。 芯片上有384个由100,000个突触连接的人工神经元,其运行速度大约是大脑计算速度的100,000倍。 海德堡大学
2012年,计算机科学家Dharmendra Modha 用强大的超级计算机模拟了5000多亿神经元的活动——甚至比人脑中850多亿左右的神经元还要多。这是近10年来研究的顶峰,Modha 从模拟啮齿类动物和猫的大脑发展到了人类那样的规模。
模拟消耗了巨大的计算资源——150万个处理器和150拍字节(150万GB)的内存——但速度仍然极其缓慢,比大脑计算的速度慢1500倍。
Modha 估计,要实现生物实时运行,需要12千兆瓦的能量,大约是胡佛大坝最大产能的六倍。 "然而,这只是大脑活动的一幅简化版漫画,"位于加州北部的IBM Almaden 研究中心的大脑启发计算首席科学家 Modha 说。 模拟结果与人类大脑的功能完全不同,人类大脑的耗电量与20瓦的灯泡差不多。
自21世纪初以来,硬件的改进以及实验和理论神经科学的进步使研究人员能够创造出更大、更详细的大脑模型。但这些模拟越复杂,它们就越会遇到传统计算机硬件的局限,如 Modha 的超耗电模型。
这是我们可以承担的最具雄心的技术难题之一——大脑的逆向工程。
——迈克·戴维斯,英特尔公司
Modha 的人脑模拟是在 Lawrence Livermore 国家实验室的 Blue Gene/Q Sequoia 超级计算机上进行的,这是传统计算机硬件的一个非常强大的集合体:它由大量传统的计算机芯片,只有指甲大小的却包含数百万晶体管的硅片提供动力。控制传统计算机芯片结构和功能的规则与我们大脑的规则大不相同。
事实上,当涉及到数字运算等任务时,计算机的"思维"与我们的大脑非常不同,这使它们有一个优势,却同时使它们在理解人类语言或从经验中学习等其他领域中变得十分原始初级。
如果科学家想要模拟一个与人类智力相匹配的大脑,传统计算机就更无优势了,可能必须从构建更好的模块开始——构建受我们大脑启发的计算机芯片。
所谓的神经形态芯片(neurophorphic chip)复制了大脑的结构——也就是说,它们使用类似于神经元动作电位的"神经元尖峰"来相互交流。 这种尖峰行为允许芯片消耗非常少的功率,并且即使在拼接到非常大规模的系统中时也保持有效的功率。
"我心目中最大的优势是可扩展性,"安大略省滑铁卢大学的理论神经科学家 Chris Eliassmith 说。在他的《如何构建大脑》一书中,Eliassmith 描述了他创建并命名为 Spaun 的大脑功能的大规模模型。当Eliassmith 运行 Spaun 的最初版本,拥有250万个"神经元"时,即使模型运行在最好的传统芯片上,它也比生物神经元慢20倍【1】。
他说:"每次我们加入几百万个神经元,速度就会慢得多。" 当 Eliassmith 在数字神经形态硬件上运行他的模型时,他发现它们不仅快得多,而且功率效率提升大约50倍。更妙的是,当 Eliassmith 模拟更多的神经元时,神经形态平台变得更有效。 这是神经形态芯片在复制自然的方式之一,当它们从蠕虫脑中的300个神经元扩大到人类大脑中的850亿左右时,大脑的运算能力和效率似乎都在增加。
神经形态芯片在执行复杂计算任务的同时消耗很少能量的能力,已经引起了科技产业界的注意。 神经形态芯片的潜在商业应用包括节能超级计算机、低功率传感器和自学习机器人。 但是生物学家有一个不同的想法:建立一个功能完备的人脑复制品。
功耗网络
神经形态硬件从动物神经系统的结构中提取一部分特性,模拟生物神经元的动作电位的尖峰传递信号。该特征允许硬件消耗少得多的功率,并且运行比传统芯片快几个数量级的脑模拟。
THE SCIENTIST STAFF; INTEL CORPORATION; © ISTOCK.COM, JOLYGON; © ISTOCK.COM, VADIM ZHAKUPOV; 照片由 UNISEM EUROPE LTD 提供; © HEIDELBERG UNIVERSITY; INTEL CORPORATION; IBM RESEARCH
当今的许多神经形态系统,从 IBM 和英特尔开发的芯片到作为欧盟人脑项目一部分而设计的两个芯片,也可供研究人员使用,他们可以远程访问这些系统来运行模拟。
研究人员正在使用这些芯片来创建单个神经元和突触的详细模型,并破译各单元是如何结合在一起,来创建大脑的子系统的。这些芯片能够让神经科学家在硬件层面上测试视觉、听觉和嗅觉的工作理论,而不仅仅是在软件上。最新的神经形态系统也使研究人员能够开始一项更具挑战性的任务:复制人类的思维和学习方式。
现在还为时尚早,真正释放神经形态芯片的潜力仍需要理论、实验和计算神经科学家,以及计算机科学家和工程师的共同努力。 但最终是一个宏大的目标——弄清楚大脑的各个组成部分是如何共同创造思想、感觉甚至意识的。
"这是我们可以承担的最具雄心的技术难题之一——大脑的逆向工程,“英特尔神经形态计算实验室主任、计算机工程师Mike Davies说。
一切都和结构有关
加州理工学院的科学家Carver Mead 在20世纪80年代发明了"神经形态"一词,他注意到,与构成现代计算机芯片的数字晶体管不同,模拟晶体管更接近地反映了神经元的生物物理学。
具体而言,模拟电路中非常微小的电流——非常微小以至于电路实际上是"断开"的——表现出类似离子通过生物神经元中的通道流动的动力学形态,该流动不会产生动作电位。
出于对 Mead 及其同事工作的兴趣,Giacomo Indiveri 决定在20世纪90年代中期在加州理工学院进行博士后研究。现在是瑞士苏黎世大学的神经形态工程师,Indiveri 所领导的研究小组继续 Mead 使用低电流模拟电路的方法,是少数坚持该方向的研究小组之一。 Indiveri 和他的团队手工设计芯片的布局,这个过程可能需要几个月的时间。他说:"这是用笔和纸的工作,因为我们试图找到实现神经动力学的优雅解决方案。"
如果你在做模拟,如今它仍然是一门艺术。
——苏黎世大学 Giacomo Indiveri
一旦他们最终确定了布局,他们就会把设计电路给一家代工厂——一家生产智能手机和电脑芯片的精密金属铸造厂。最终的结果看起来就像一个智能手机芯片,但它的功能就像一个"神经元"网络,通过几个节点传递尖峰电流。
在这些模拟神经形态芯片中,信号可通过电压尖峰在强度上实际变化来实现传递。就像在大脑中一样,信息是通过来自不同神经元的限时尖峰信号的来传递的。
"如果你向神经生理学家展示这些神经元中的一个的输出,他将无法告诉你它是来自硅神经元还是来自生物神经元,"Indiveri 说。
这些硅神经元代表了复制生物体神经系统,也叫 wetware(与硬件 hardware 相对)的不完美尝试。生物神经元是混合的模拟-数字系统; 它们的动作电位模拟数字硬件的离散脉冲,神经元中的电压电平影响所传输的信息。
神经形态芯片的特征是与生物神经元的物理行为非常相似,该模拟性质也使得它们传输的信号不那么精确。虽然我们的大脑已经进化到可以补偿其不精确的部分,但研究人员却依然将这个不精确性的基本概念引入了数字领域。
IBM 和英特尔等公司一直专注于数字神经形态芯片,其硅神经元复制了信息在生物神经元中流动的方式,但具有不同的物理特性,这与传统的数字芯片占据了我们绝大多数电脑和电子产品的原因相同——它们的可靠性更高,制造更容易。
照片由 UNISEM EUROPE LTD 提供
构建模块: 每个 SpiNNaker 芯片与内存一起封装(左上),然后拼接成更大的设备,如右上方的48节点板。 多个板可以连接在一起以形成更大的 SpiNNaker 系统(上图)。图片由曼彻斯特大学,STEVE FURBER 和他的同事提供
这些数字芯片保留神经形态以捕获大脑结构。 在这些数字神经形态芯片中,尖峰信号是以信息包的形式出现的,而不是电压变化的实际脉冲。英特尔的 Davies 说:"这与我们通常在电脑上设计的任何东西都有很大的不同。"
不管尖峰信号采取什么形式,系统只在输入达到某个阈值时才会转发消息,再允许神经形态芯片进行操作,而不是不断地消耗功率。 这与大脑神经元相互交流方式类似,它们是在准备好的时候(电压达到动作电位)而不是在计时员的命令下进行交流的方式类似。传统的芯片大多是线性的,在严格的内部时钟的控制下,在存储数据的存储器硬件和计算数据的处理器之间传递数据。
当Modha设计IBM的神经形态芯片TrueNorth时,他首先分析了大脑的长距离接线图,这些接线图描绘了猕猴和人类大脑不同区域之间的连接方式【2】。它告诉我们有关长距离连接,短距离连接以及神经元和突触动力学的信息,”他说。
到2011年,Modha 创建了一个包含256个硅神经元的芯片,与秀丽隐杆线虫的大脑规模相同。利用最新的芯片制造技术,Modha 将神经元压缩得更紧密,并将4096个芯片拼接在一起,从而在2014年发布了 TrueNorth,该芯片包含100万个合成神经元——大约相当于蜜蜂大脑的大小——而功耗却比传统芯片降低几百倍【3】 。
像 TrueNorth 这样的神经形态芯片,在当中的人工神经元之间具有非常高的连通性,与哺乳动物大脑中所观察到的一样。人类大脑的850亿个神经元通过大约1万亿个突触高度互连。
TrueNorth 要简单得多——它包含了2.56亿个”突触“以连接100万个神经元——但通过将多个TrueNorth 芯片拼接在一起,Modha 创建了两个更大的系统:
一个模拟1600万个神经元和40亿个突触
另一个模拟6400万个神经元和160亿个突触。
目前,来自不同机构的200多名研究人员可以免费使用 TrueNorth。
神经形态芯片除了有高度互连和突出的特性之外,它们还复制了生物神经系统的另一个特征:与传统的将处理器和内存配置在不同位置的计算机芯片不同,神经形态芯片往往有许多微型处理器,每个处理器都有少量的内置内存。
这种配置与人脑的组织方式类似,可同时进行数据存储和处理。研究人员认为,神经形态结构的这一特性可以使利用这些芯片构建的模型更好地复制人类的学习和记忆。
学习能力是英特尔 Loihi 芯片的一个关注点,该芯片于2017年9月首次发布,并于去年1月与研究人员共享。为了模拟大约13万个神经元和1.3亿个突触,Loihi 结合了可塑性时间依赖性峰电位(STDP)模型,这种机制通过在大脑内突触前和突触后峰电位的相对时间来调节突触的连接强度【4】。
如果一个神经元刚好在第二神经元之前激发,则其与第二神经元的连接增强,而如果激发顺序相反,则连接强度减弱。 突触强度的这些变化被认为在人脑的学习和记忆中起着重要的作用。
领导 Loihi 研究的 Davies 说,它的目的是捕捉我们的大脑所擅长的,而目前的人工智能模型却不擅长的那种快速、终身的学习。和 TrueNorth 一样,Loihi 也被分发给了不同的研究人员。戴维斯说,随着越来越多的研究小组使用这些芯片来模拟大脑,"我们希望可以将大脑中那些惊人能力所依据的广泛原理,渐渐变得清晰起来。"
神经科学的神经形态学
对于所有潜在的科学应用,TrueNorth 和 Loihi 并不是专门为神经学家设计的。他们主要是研究芯片,旨在测试和优化神经形态架构,以提高其能力和易用性,以及探索各种潜在的商业应用。
从语音和手势识别到节能机器人和设备上的机器学习模型,这些模型可以为智能智能手机和自动驾驶汽车提供动力。另一方面,欧盟的人类大脑项目开发了两个神经形态硬件系统,其明确目标是理解大脑。
BrainScaleS 于2016年推出【5】,它将大量芯片集成在大型硅片上——更像是超薄的飞盘,而不是手指甲大小。每个晶圆包含384个模拟芯片,其操作类似于升级版本的 Indiveri 模拟芯片,针对速度而非低功耗进行优化。每个晶片可模拟大约20万个神经元和4900万个突触。
建立大脑的功能模型
神经形态技术正在推动更大、更复杂的大脑模型发展,这些模型已经快达到现代超级计算的运力极限。Spaun 就是一个例子。250万神经元模型重构了人类大脑执行各种认知任务的若干特征结构和功能。就像人类一样,相比长序列,它更容易记住一个短序列的数字,并且比中间的数字更容易记住前几个和最后几个数字。
虽然研究人员已经在传统硬件上运行了部分当前 Spaun 模型,但神经形态芯片对于有效执行目前正在开发的更大、更复杂版本的模型将是至关重要的。
当显示一系列数字(1)时,Spaun 的视觉系统将每个数字的图像压缩并编码为特定的信号模式,这种模式与生物神经元激发的信号模式相类似。 然后将关于每个图像的信息-——即数字的概念——编码为另一种峰值信号模式(2),然后将该信号模式及相关的数字在序列(3)中的位置信息,一起压缩并存储在工作存储器中。 这个过程模拟了视觉和颞皮质中的视觉输入的分析和编码,以及顶叶和前额皮质中的存储。
当被要求在某个时间之后回忆该序列时,模型的信息解码区域依次从存储列表(4)中解压缩每个数字,并且电动处理系统将所得到的概念映射到激发系统,形成激发模式(5)。最后,电机系统翻译该激发模式,命令物理臂的绘制每个数字(6)。这类似于人类的回忆,顶叶皮层从大脑的存储区域(如前额叶皮层)提取记忆,并将其转化为运动区域的行为。
BrainScaleS,以及欧盟其他被称为 SpiNNaker 的神经形态系统,受益于成为人类大脑项目一部分,这是一个庞大的理论、实验和计算神经科学家群体。与这个社区的互动,使得系统中不断增加有助于科学家的新功能,而这些新发现又迅速回馈支持该研究领域。
20年前,英国曼彻斯特大学的计算机工程师Steve Furber 构想了 SpiNNaker,十多年来他一直在设计它。Furber 说,在花了大约6年时间研究 SpiNNaker 背后的小型数字芯片,之后他和他的同事在2011年实现了全功能。
自那以后,研究小组一直在把这些芯片组装成越来越大的机器,最终在2018年末启动了一台百万处理器的机器。Furber 预计,SpiNNaker 应该能够实时模拟老鼠大脑中的1亿个神经元——而传统超级计算机的要实现这个目标速度要慢1000倍左右【6】。
目前学界实验室可免费访问欧盟人类大脑项目系统。神经学家开始在 SpiNNaker 硬件上运行他们自己的程序,以模拟大脑特定子系统中的高级处理,例如小脑、皮层或基底节。
例如,研究人员试图模拟一个小的重复结构单位——微皮层柱——它位于大脑外层,负责大多数高级功能。"微柱很小,但它仍然有8万个神经元和25亿个突触,所以建模并不是一件小事,"Furber 说。
接下来,他补充道,"我们开始考虑系统层面,而不仅仅是个别的大脑区域",逐渐接近于为人类智能提供动力的850亿神经元的全尺寸模型。
模仿大脑
达特茅斯学院的计算神经学家 Richard Granger 说,使用神经形态硬件对大脑建模可以揭示神经元计算的基本原理。神经学家可以非常详细地测量神经元的生物物理和化学性质,但是很难知道这些性质中的哪一个对大脑的计算能力实际上是重要的。尽管用于神经形态芯片的材料与人类大脑的细胞物质完全不同,但使用这种新硬件的模型可以揭示大脑如何传递和评估信息的计算原理。
在硅中复制简单的神经回路帮助 Indiveri 发现大脑设计的潜在好处。 他曾经给一位博士生一块神经形态芯片,该芯片有能力模拟峰值频率适应性,这是一种让人类习惯于持续刺激的机制。
为了在芯片上留出空间,学生决定不实现这个功能。然而,当他努力降低芯片的带宽和功率要求时,他最终得到的结果看起来与他已经移除的峰值频率适应性相同。
Indiveri 和他的同事还发现,在长距离上发送模拟信号的最佳方式不是将它们表示为例如连续可变的流,而是表示为一系列尖峰信号,就像神经元所做的那样。Indiveri 说:"如果你想最小化功率和带宽,神经元所使用的是最佳的信号传输技术。"
神经形态硬件也可以让研究人员测试他们关于大脑功能的理论。 康奈尔大学的计算神经学家 Thomas Cleland 建立了嗅球模型,以阐明我们嗅觉形成的原理。使用 Loihi 芯片使他能够建立足够快的硬件模型来模仿生物学。
当从化学传感器(作为我们的气味受体的人工版本)获得数据时,系统在仅仅暴露于一个样本之后就学会了识别气味,超越了传统的机器学习方法,更接近人类的高级嗅探器。
Davies 说:"通过成功地仿制出目标,并在神经形态芯片中的运行,这是一个很好的确认,你确实了解这个系统。"
Cleland 的嗅觉模型并不总是能达到预期的效果,但那些"失败"的实验也同样具有启发性。气味输入有时在传感器看来与模型预测的不同,可能是因为气味信号比预期的更复杂或更嘈杂,或者因为温度或湿度干扰了传感器。 他说:"输入变得有些古怪,我们知道这不会愚弄我们的鼻子。"
研究人员发现,通过关注先前忽略的气味输入中的"噪声",嗅觉系统模型可以正确地检测到更广泛的输入 结果 Cleland 更新了他的嗅觉模型,研究人员现在可以观察生物系统,看看他们是否使用这种以前未知的技术来识别复杂的或嘈杂的气味。
Cleland 希望扩大他的模型,它可以在生物实时层面运行,以分析来自成百上千个传感器的气味数据,而在非神经形态硬件上这可能需要几天的时间运行。
"只要我们能把算法放到神经形态芯片上,那么它的规模就会非常可观,"他说。 "对我来说,最令人兴奋的事情是能够运行这些来自16000个传感器的数据集,以看看当我们扩大规模时,算法会有多好。"
SpiNNaker、TrueNorth 和 Loihi 都可以在生物学中以相同的速度运行神经元和大脑的模拟,这意味着研究人员可以使用这些芯片识别刺激——比如图像、手势或声音——并在它们出现时立即处理和响应它们。除了允许 Cleland 的人造鼻子处理气味,这些能力可以使机器人能够实时感知和反应他们的环境,而消耗很少的能量。 与大多数传统计算机相比,这是一个巨大的进步。
对于一些应用程序,如建模学习过程,可能需要数周、数月甚至数年,它有助于更快一些。这就是 BrainScaleS 出现的原因,它的运算速度比生物大脑快1000-10000倍。而且这个系统只会变得更先进。 它正在升级到 BrainScaleS2,新的处理器是在神经科学家的密切合作下开发的。
新系统将能够更好地模拟学习和模拟化学过程,例如多巴胺对学习的影响,而这在其他神经形态系统中是无法复制的。研究人员说,它还将能够模拟各种类型的神经元、树突和离子通道,以及结构可塑性的特征,如突触的丧失和生长。
也许有一天,这个系统甚至能够近似人类的学习能力和智力。 "我认为,理解生物智能是本世纪最大的问题,"海德堡大学的生物物理学家 Johannes Schemmel 说,他曾帮助开发 BrainScaleS。
查阅 The Intelligence Puzzle,The Scientist,2018年11月
当前的人工智能系统在灵活性和学习能力方面仍然落后于大脑。 Furber 说:"谷歌的网络在给猫看了一千万张猫的照片后,就能很好地识别猫的图像,但如果你给我两岁的孙子看一只猫,他一辈子都能认出猫。"
随着 Loihi 将于今年晚些时候推出,Eliasmith 希望能够为他的 Spaun 模型增加更多高级认知和学习行为。他说,他特别兴奋地试图精确地模拟人类如何能够快速而容易地学习认知任务,比如一个新的棋盘游戏。著名的人工智能玩家,如 AlphaGo,必须模拟数以百万计的游戏来学习如何玩得好。
目前尚不清楚,复制人类智力是否只是个建立更大、更精细的大脑模型的问题。 "我们只是不知道我们思考大脑的运作方式是否有根本的缺陷,"Eliassmith 说。"我们不知道我们能走多远,除非我们有更好的硬件,能够用数亿个神经元实时运行这些东西,"他说。"这就是我认为神经形态学将帮助我们实现的目标。"
参考文献:
1. C. Eliasmith et al., “A large-scale model of the functioning brain,” Science, 338:1202–05, 2012.
2. D.S. Modha, R. Singh, “Network architecture of the long-distance pathways in the macaque brain,” PNAS, 107:13485–90, 2010.
3. P.A. Merolla et al. “A million spiking-neuron integrated circuit with a scalable communication network and interface,” Science, 345:668–73, 2014.
4. M. Davies et al. “Loihi: A neuromorphic manycore processor with on-chip learning,” IEEE Micro, 38:82–99, 2018.
5. J. Schemmel et al., “A wafer-scale neuromorphic hardware system for large-scale neural modeling,” Proc 2010IEEEInt Symp Circ Sys, 2010.
6. S.B. Furber et al., “The SpiNNaker Project,” Proc IEEE, 102:652–65, 2014.
作者信息
作者:Sandeep ravindran (科学记者)
编译:Ben(brainnews创作团队成员)
校审/排版:Simon (brainnews编辑部)
前 文 阅 读